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【 摘 要 】 随 着 计算 机 互联 网 技术 的 飞速 发 展 ,建筑 信息 模型 技术 (BIM) 应 运 而 生 。BIM 作为 一 种 新 兴 的 建筑 技术 
理念 ,推动 着 建筑 行业 发 生 巨大 的 变革 ,同时 ,大 数据 \ 云 计算 技术 也 成 为 当下 热门 话题 。 将 大 数据 云 计算 与 BIM 
技术 相 结 合 ,将 是 未 来 建筑 行业 的 发 展 趋势 。 本 文 研究 如 何 将 BIM 模型 存储 在 基于 大 数据 平台 的 开源 HBase 数据 
库 中 。 通 过 对 BIM 模型 的 开放 性 标准 IFC 的 内 部 结构 进行 研究 及 解析 ,设计 出 基于 IFC 的 HBase 数据 库 的 格式 ， 
” 然后 开发 基于 IFC 格式 的 HBase JAVA API 总 体 类 库 。 最 后 通过 运用 HBaseJAVA API 存储 示例 说 明 存 储 的 技术 
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中 传统 建筑 行业 数据 量 多 ,数据 收集 困难 ,数据 
交换 效率 低下 。 建 筑 信息 模型 (BIM) 是 以 三 维 表达 
技 坟 为 基础 ,集成 了 工程 项 目的 各 种 信息 ,其 核心 
找 杰 是 要 实现 建设 项 目 各 个 参与 方 的 信息 共享 与 
交 颈 ,解决 以 往 建筑 信息 孤岛 的 问题 。IFC 标准 作 
为 至 放 的 BIM 标准 ,是 一 个 计算 机 可 以 处 理 的 建筑 
数据 表示 和 交换 标准 ,其 目的 是 支持 工程 项 目 全 寿 
命 周 期 内 各 个 阶段 信息 的 共享 与 交换 器 。IFC 标准 
是 实现 不 同 应 用 软件 之 间 数 据 交 流 与 互 操作 的 中 
间 件 , 它 不 依赖 任何 一 个 具体 的 信息 系统 ,也 不 受 
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筑 数据 存储 到 大 数据 平台 ,进而 进行 建筑 数据 的 管 
理 和 分 析 。HBase 数据 库 作 为 开源 的 大 数据 平台 
Hadoop 的 一 部 分 ,解决 了 海量 数据 的 高 效 存储 问 
题 。 因 此 ,本 文 将 探讨 通过 HBase JavaAPI 将 基于 
IFC 格式 的 BIM 模型 储存 到 HBase 数据 库 的 具体 技 
术 和 方法 。 

1 IFC 标准 的 概述 


1.1 IFC 整体 框架 

IFC 标准 是 由 国际 协作 联盟 IAI( the International 
Alliance for Interope-rability , 现 名 为 BuildingSMART ) 
提出 ,用 于 解决 不 同 专业 之 间 以 及 同一 专业 之 间 信 


任何 一 个 或 一 类 软件 开发 商 的 控制 ,并 且 能 够 用 于 


息 交 换 与 共 诗 。IFC 标准 自 底 层 到 上 层 依 次 包括 : 


描述 建筑 项 目 全 生命 期 内 不 同 专 业 的 所 有 产品 妆 
据 信息 中 。 然而 以 往 的 基于 IFC 文件 式 的 交换 方式 
已 经 无 法 满足 日 益 复杂 的 工程 的 需求 。BIM 数据 存 
储 技术 是 建筑 行业 需要 解决 的 首要 问题 。 
随 着 互联 网 、 云 计算 技术 的 迅速 发 展 ,大 数据 
在 医疗 、 卫 生 教育 .工业 行业 等 行业 已 经 取得 了 巨 
大 的 经 济 效益 ,采用 大 数据 技术 来 辅助 现代 建筑 行 
业 也 必 将 为 建筑 业 带 来 巨大 的 影响 。 将 建筑 行业 
与 大 数据 技术 相 结 合 , 首 先 要 解决 的 就 是 如 何 将 建 
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域 . 设 备 管理 领域 等 ) 的 实体 概念 。 在 IFC 框架 中 
领域 层 共享 层 .核心 层 所 有 的 实体 都 有 一 个 共同 
的 抽象 基 类 lfcRoot, 且 都 具有 唯一 的 标识 (GUID)。 
资源 层 的 实体 不 能 独立 存在 通常 作为 上 层 中 实体 
的 属性 存在 。 
1.2 基于 IFC 的 实体 表达 

完整 的 IFC 文件 模型 由 类 型 定义 .计算 实 体 属 
性 值 的 函数 和 规则 、 以 及 常用 属性 集 的 预定 义 组 
成 。 类 型 定义 又 包括 实体 类 型 .选择 类 型 .定义 类 
型 和 枚 举 类 型 四 种 。 其 中 实体 类 型 是 类 型 定义 的 
核心 也 是 信息 交换 与 共享 的 载体 , 其 等 同 于 面向 对 
象 程序 语言 中 类 的 概念 。 类 型 实体 中 其 他 类 型 的 
功能 主要 是 作为 属性 值 被 实体 实例 所 引用 。 

会 在 IFC 中 性 文件 中 ,任何 实体 都 是 通过 属性 来 
开 候 措 述 自身 的 信息 。 这 些 属性 可 以 分 为 直接 属 
性 < 时 出 属性 和 反 转 属性 。 如 图 1。 在 HeWall 实体 

接 属 性 是 一 些 直 接 信息 或 指标 量 如 Globalld、 
Name 等 。 导 出 属性 是 指 由 其 他 实体 来 表达 的 属 
性 ,如 OwnerHistory 、ObjectPlacement 、Representation 
等 于 反 转 属性 是 关键 字 “INVERSE” 之 后 定义 的 一 
8 “双向 

对 多 或 多 对 多 的 关联 关系 。 
1.35 IFC 实体 分 类 
SCIFC 信息 交换 的 载体 是 实体 ,实体 是 IFC 信息 
交 黎 的 最 小 单元 。 正 C 中 的 实体 按 是 否 可 以 独立 交 
换 则 分 为 可 独立 交换 实体 和 不 可 独立 交换 实体 。 
CC ENrITY Tscmally 


如 表 1 所 示 , 可 独立 交换 实体 都 是 继承 自 IfcRoot。 
将 IfcRoot 的 派生 实体 HecObject IfcRelationship 以 及 
IfcPropertyDefinition 按照 在 信息 交换 中 所 起 到 的 作 
用 来 划分 ,又 可 划分 为 主体 实体 和 辅助 实体 ,如 表 2 
所 示 。 


表 1 IFC 实体 的 分 类 

分 类 方式 类 别 说 明 

按照 是 否 ”可 独立 交换 。 ”可 独立 交换 的 实体 继承 自 HfeRoot, 具 
可 独立 交换 有 唯一 的 ID(GUID) 具 备 全 局 标识 特 
性 分 布 在 核心 层 ,交互 层 和 领域 层 。 
不 可 独立 交换 。 不 可 独立 交换 的 实体 分 布 在 资源 层 , 又 
(资源 层 实体 ) ” 称 为 资源 实体 。 不 是 继承 自 IfcRoot， 
没有 GUID ,不 具备 全 局 标识 特性 ,通常 
作为 可 独立 交换 实体 的 属性 存在 。 


表 2 ”JfcRoot 派生 实体 的 分 类 

分 类 方式 类 别 说 明 
照 在 信 ”主体 实体 。 主体 实体 是 指 由 对 象 实体 ( IcObject) 所 派 
交换 的 生出 来 的 实体 。 包 括 HeProduct( 产品 ) .下 
分 类 cProcess( 过程 )、IfcControl (控制 )、IfcRe- 
source( 资 源 )、lfcActor (角色 )、 IfcProject 
(项 目 ) 和 IfcGroup( 分 组 ) 及 其 子 类 。 这 些 
实体 在 信息 交换 中 起 主导 作用 。 
辅助 实体 。 ”辅助 实体 是 指 在 IfcRoot 中 除去 主体 实体 
(对 象 实体 ) 以 外 的 实体 ,包括 IfcRelation- 
ship ,IfcPropertyDefinition 及 其 子 类 , 这些 
辅助 实体 对 主体 实体 起 到 修饰 扩充 定义 
关系 等 作用 。 


仿 汪 泣 


wz 


1.4 IFC 文件 的 解析 
IFC 标准 是 基于 EXPRESS 语言 来 描述 建筑 数 


ENTITY IfcRoot; 
© GlobalId : IfcGloballyUnigueId; 
OwnerHistory : IfcOwnerHistory; 
Name : OPTIONAL IfcLabel; 
Description : OPTIONAL IfcText; 


ENTITY IfcObjectDefinition; 
INVERSE 


HasAssignments 
IsDecomposedBy 
Decomposes 
HasAssociations 
ENTITY IfcObiect; 
ObjectType 
INVERSE 
IsDefinedBy 
ENTITY IfcProduct; 
ObjectPlacement 


Representation 
INVERSE 

ReferencedBy 
ENTITY IfcElement; 


: SET OF IfcRelAssiqns FOR RelatedObjects; 

: SET OF IfcRelDecomposes FOR RelatingObject; 

: SET [0:1] OF IfcRelDecomposes FOR RelatedObjects; 
: SET OF IfcRelAssociates FOR RelatedObjects; 

: OPTIONAL IfcLabel; 

: SET OF IfcRelDefines FOR RelatedObjects; 


: OPTIONAL IfcObjectPlacement; 
: OPTIONAL IfcProductRepresentation; 


: SET OF IfcRelAssignsToProduct FOR RelatingProduct; 


Tag : OPTIONAL IfcIdentifier; 

INVERSE 
HasstructuralMember : SET OF IfcRelConnectsStructuralFlement FOR RelatingFlement; 
FillsVoids : SET [0:1] OF IfcRelFillsElement FOR RelatedBuildingElement; 
ConnectedTo : SET OF IfcRelConnectsElements FOR RelatingElement; 
HasCoverings : SET OF IEcRelCoversB1dqElements FOR RelatingBuildingElement; 
HasProjections : SET OF IfcRelproiectsElement FOR RelatingElement; 
ReferencedInstructures : SET OF IfcRelReferencedInSpatialStructure FOR RelatedElements; 
HasPorts : SET OF IfcRelConnectsPortToEFlement FOR RelatedElement; 
HasOpenings : SET OF IfcRelVoidsElement FOR RelatingBuildingElement; 


IsConnectionRealization 


: SET OF IfcRelConnectsWithRealizingElements FOR RealizingElements; 


ProvidesBoundaries 
ConnectedFrom 
ContainedInstructure 
ENTITY IfcBuildingqFlement; 
ENTITY IfcWall; 
END ENTITY; 


: SET OF IfcRelSpaceBoundary FOR RelatedBuildingElement; 
: SET OF IfcRelConnectsFlements FOR RelatedElement; 
: SET [0:1] OF IfcRelContainedInSpatialStructure FOR RelatedFElements; 


图 1 IfcWall 属性 继承 
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据 。EXPRESS 是 一 种 面向 对 象 的 信息 描述 性 语言 ， 
不 是 编程 语言 ,不 能 直接 用 于 编程 开发 。 因 此 需要 
对 IFC 模型 进行 解析 ,然后 才能 运用 计算 机 语言 如 
C#、C + + 、JAVA 等 来 通过 编程 具体 实现 所 需 的 
功能 。 

目前 用 于 IFC 解析 的 软件 有 很 多 , Jotne EPM 
Technology 公司 的 EDM; 基于 C+ + 的 TfcPlusPlus; 
基于 . NET 平台 的 xBIMToolKit; 基于 JAVA 的 Ifc- 
ToolsProjcet 等 。 本 文采 用 的 是 基于 Java 的 IfcTool- 
sProjcet 中 的 IFC JAVA Toolbox 工具 。 该 工具 可 以 
方便 的 阅读 编写、 修改 和 添加 IFC 文件 。IFC JA- 
VA Toolbox 支持 IFC 模式 中 所 有 实体 的 直接 属性 和 

属性 。 针 对 IFC 中 的 每 个 实体 ,IFC JAVA Tool- 
bo 革 中 都 有 一 个 对 应 的 Java 类 ,其 核心 模型 [fcModel 
为 多 取 和 设置 IFC 对 象 的 任何 显 式 属性 和 反 转 属性 
提供 方法 ,因此 可 以 实例 化 并 处 理 任何 对 象 ” 。 创 

个 HfcModel 类 作为 获取 工程 的 入口 类 ,该 类 包 
含 了 模型 中 所 有 的 实体 。 通 过 ifeModel. readStepFile 
(9 对 IFC 模型 的 信息 进行 读 取 与 解析 加 载 。 具 体 
的 实现 方式 如 图 2 所 示 。 

过 每 个 IFC 文件 有 且 仅 有 一 个 IfcProject 对 象 , 它 
是 整个 IFC 文件 的 最 高 级 别 的 实体 类 型 ,所 以 无 论 
是 利用 IFC 文件 临时 传递 一 个 零 部 件 一 根 杆 件 ,还 

载 整个 建筑 工程 ,都 应 该 从 HcProject 开始 , 自 
上 而 下 地 逐 层 定义 对 象 , 直到 完整 表达 所 要 表达 的 
模 旱 信息 中 ,通过 分 析 IFC 模型 文件 , 先 获得 该 模 
2 定义 的 IfcProject 对 象 、IfcSite 对 象 HcBuilding 


HRegionServer 


HBase 


回 辐 回 则 加 百 


// 定 义 IfeModel 类 
private IfcModel createIfcModel0 { 
/ 创建 一 个 IfeModel 实 例 
IfcModel ifcModel = new IfcModel0); 
/从 文件 系统 中 加 载 IFC STEP 文 件 
File stepFile = new File("fNifepractise \ 某 教学 楼 项 目 .ife"); 
try { 
ifcModel.readStepFile(stepFile); 
} catch (Exception e) { 
/TODO Auto-generated catch block 
e.printStackTrace(); 


return ifcModel; 


2 IFC 文件 的 获取 与 解析 


对 象 IfcBuildingStorey 对 象 等 以 及 与 所 有 建筑 楼 层 
对 象 关 联 的 墙 (IeWal) 深 (Ifc Beam) 、 柱 (IfcCol- 
umn) 、 板 (IfcSlab) 楼 梯 (IfcStair) 、 窗 (ItcWindow ) ， 
门 ( 芷 Door) 等 结构 构件 对 象 , 这 些 结构 构件 对 象 是 
主体 建筑 的 主要 构件 ,也 是 工程 数据 交换 的 核 
心 ” 。 对 于 获取 到 的 对 象 实体 通过 IFC JAVA Tool- 
box 中 的 get-methods 和 set-methods 来 读 取 和 设置 特 
定 的 IFC 实体 的 属性 。 对 于 IFC 实体 反 转 属性 可 通 
过 各 自 的 get 方法 获得 ,不 需要 set 方法 ,因为 他 们 
是 自动 解决 的 。 


2 HBase 数据 库 的 概述 


2.1 HBase 数据 库 整体 架构 
NoSQL( 非 关系 型 数据 库 ) 是 一 种 新 的 数据 管理 

专门 设计 的 技术 来 满足 要 求 的 数据 不 同 , 它 不 需要 

一 个 预定 义 的 数据 模式 ,这 意味 着 它 不 仅 使 IFC 架 


[CCI I] 


Hadoop 


3 HBase 系统 架构 
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构 中 的 所 有 数据 定义 映射 到 数据 库 结构 中 ,而 且 也 
可 以 添加 新 功能 的 数据 结构 实体 ,这 符合 IFC 的 发 
展 模 式 ,不断 采用 新 的 建 模 概 念 到 新 的 版 本 中 。 

HBase( Hadoop Database) 作 为 一 种 NoSQL 数据 
库 是 基于 GoogleBigTable 的 开源 实现 ,主要 用 于 存 
储 海量 的 数据 。 它 是 构建 在 Hadoop 中 的 HDFS 之 
上 的 分 布 式 的 面向 列 的 开源 数据 库 。 利 用 Hadoop 
中 的 MapReduce 来 处 理 数 据 。 利 用 Zookeeper 来 处 
理 协同 服务 。HBase 的 系统 架构 图 如 图 3 所 示 。 

客户 端 Client 是 整个 集群 的 入 口 ,用户 可 以 直 
接 通过 Client 操作 HBase ,使 用 HBase RPC( 远程 调 
用 ) 机 制 与 HMaster 和 HRegionServe 通信 。Client 与 
HMaster 通信 和 是 进行 管理 类 的 操作 ,与 RegionServe 
通信 是 进行 数据 读 写 类 操作 。 

LO 程序 的 协调 服务 Zookeeper 是 集群 中 的 协调 者 ， 
其 主要 功能 有 :保证 了 集群 中 任何 时 候 只 有 一 个 
MaSier; 实时 监控 RegionServe 的 上 线 和 下 线 信息 ， 
并 通知 给 Master; 存储 所 有 Region 的 寻 址 入 口 ; 存 
储 Base 的 schema 和 table 元 数据 。 

六 _HBase 中 主 节点 HMaster 管理 用 户 对 Table 的 
增删 改 查 ,管理 HRegionServe 的 负载 均衡 ,调整 Re- 
gi 分 布 。 在 Region Split 后 , 负责 新 Region 的 


“ 全 表 扫 描 。 

(2 ) 列 族 ( ColoumFamily) 

在 HBase 表格 中 列 ( Coloum) 是 属于 列 族 
( ColoumFamily ) 的 一 部 分 , 列 族 是 列 的 集合 ,一 个 列 
族 可 以 包含 多 个 列 , 列 族 支 持 动态 的 扩展 ,在 建 表 
时 不 需要 预先 定义 列 的 数量 以 及 类 型 , 列 中 的 数据 
都 是 以 二 进 制 存储 ,没有 数据 类 型 。 列 可 以 表示 为 
< 列 族 > :< 限定 符 > ; 这 就 表明 一 个 列 族 中 所 有 
的 列 成 员 都 有 相同 的 前 缀 ; 例如 : 列 courses :Eng- 
lish , 列 courses: Math , 和 列 courses: History 都 是 列 族 
courses 的 成 员 ,“:” 是 分 隔 符 ,用 来 区 分 前 级 和 
列 名 。 

(3) 时 间 戳 (Timestamp ) 与 存储 单元 (Cell) 

HBase 中 单元 格 ( Cell ) 由 Rowkey, ColoumFami- 
ly,Coloum ,Timestamp 唯一 确定 ,每 一 个 存储 单元 都 
保存 着 同一 份 数据 的 多 个 版 本 ,这 些 不 同 的 版 本 通 
过 时 间 改 来 索引 。 在 写 人 数据 时 Timestamp 可 以 由 
HBase 自动 赋值 也 可 以 手动 赋值 ,最 终 不 同 的 版 本 
按照 时 间 倒 序 排序 , 即 最 新 的 数据 显示 在 前 面 。 一 
般 系统 默认 保存 3 个 版 本 。 


表 3 HBase 逻辑 模型 


< =HRegionServe 维护 Region 并 往 HDFS 中 书写 数 
据 * 是 HBase 中 最 核心 的 模块 。 管 理 HBase 中 逻辑 
表 的 结构 , 当 表 的 大 小 超过 设计 值 时 , Split HRe- 
glons 

2.23 HBase 数据 库存 储 模式 

从 逻辑 上 看 HBase 以 表 的 形式 存储 数据 , 表 由 
行 和 列 组 成 ,每 个 列 是 属于 某 个 列 族 。 在 HBase 中 
并 不 是 每 行 每 列 都 存储 数据 , 它 是 一 个 稀 玻 的 表 。 
在 HBase 中 也 不 存在 null( 空 记录 ) 。 当 存在 没有 数 
据 的 情况 时 , HBase 不 会 存储 任何 东西 。HBase 的 
逻辑 模型 如 表 3 所 示 。 关 于 表 中 的 几 个 概念 的 介绍 
如 下 : 

(1) 行 键 ( Rowkey) 

Rowkey 是 数据 行 在 表 里 的 唯一 标识 ,作为 检索 
记录 的 主键 。Rowkey 可 以 为 最 大 长 度 不 超过 64KB 
的 任意 字符 串 ,并 按照 字典 序 存储 。 访 问 HBase 表 
中 的 行 有 三 种 方式 : 

“ 通过 单个 行 键 (Rowkey ) 访问; 

" 通过 给 定 行 键 的 范围 访问 ; 


行 键 时 间 惟 列 族 ( ColoumFamily) 
(Rowkey) (Timestamp) Colouml Coloum2 
1 3 Colouml Value3 Coloum2 Value3 
世 Colouml Value2 Coloum2 Value2 
2 tl Colouml Valuel Coloum2 Valuel 
论 Colouml Value5 Coloum2 Value5 
tl Colouml Value4 Coloum2 Value4 


2.3 HBase JAVA API 简介 

HBase API 由 多 种 形式 ,但 由 于 HBase 的 开发 
语言 是 Java 语言 ,Java API 是 最 有 效 的 访问 方式 。 
本 文 主要 人 研究 原生 Java API 形式 。 主 要 介绍 五 大 
类 : HBaseConfiguration 、HBaseAdmin 、HTableDescrip- 
tor . HTable .HBase CRUD Operation 。 

(1) HBaseConfiguration 

在 使 用 原生 Java 客户 端 前 ,首先 要 配置 客户 
端 ,HBaseConfiguration 是 用 于 客户 端的 配置 类 , 它 
是 每 一 个 Hbase Client 都 会 使 用 到 的 对 象 。 可 以 通 
过 如 下 代码 构建 该 对 象 : 

Configurationconfig = HBaseConfiguration. create 


() 
(2)HBaseAdmin 
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HBaseAdmin 类 是 HBase 数据 库 的 管理 入口 类 ， 
提供 一 个 接口 来 管理 HBase 数据 库 的 表 信 息 , 并 管 
理 表格 的 元 数据 。 它 提供 的 方法 包括 :创建 表 、 删 
除 表 修改 表 、 使 表 有 效 或 无 效 ,以 及 添加 或 删除 表 
列 族 成 员 等 。 

(3 )HTableDescriptor 

HTableDescriptor 主要 是 对 表 里 的 列 族 进行 描 
述 。 可 以 通过 如 下 代码 构造 该 对 象 : 

HTableDescriptort = new HTableDescriptor ( ta- 
bleName ) 

(4)HTable 

在 HBase 中 HTable 用 来 封装 表格 对 象 , 对 表格 
的 增删 改 查 操作 主要 通过 它 来 完成 , 当 构 建 多 个 
Hialle 对 象 时 ,HBase 推荐 所 有 的 HTable 使 用 同一 
人 (Gonfiguration。 这 样 ,HTable 之 间 便 可 共享 HCon- 
nection 对 象 .zookeeper 信息 以 及 Region 地 址 的 缓存 
信息 。 

(5)HBase CRUD Operation 

CNHBase 的 CRUD 操作 接口 用 到 了 在 hbase. cli- 
eR 包 下 的 org. apache. hadoop 中 的 HTable 类 , 它 提 
供 手 用 户 所 需 的 所 有 的 存储 ,从 HBase 中 检索 数据 
删除 过 时 的 值 等 功能 "1 。 对 表 的 创建 删除、 显 
示 以 及 修改 等 ,可 以 用 HBaseAdmin ,一 旦 创建 了 表 ， 
那 慨 可 以 通过 HTable 的 实例 来 访问 表 , 每 次 可 以 往 
表明 增加 数据 。 

C1) put 方 法 

.三 GD 单行 put 操作 

《3 向 HBase 中 存储 数据 可 以 通过 如 下 代码 来 实 
现 该 功能 的 调用 : 

Void put( Put put) throws IOException 

这 个 方法 以 单个 Put 或 存储 在 列表 中 的 一 组 
Put 对 象 作为 输入 参数 。 创 建 put 实例 时 ,用 户 需 要 
提供 一 个 行 键 row, 在 HBase 中 每 行 数据 都 有 唯一 
的 行 键 (rowkey ) 作为 标识 。 创 建 put 实例 后 ,就 可 
以 向 该 实例 添加 数据 。 使 用 add( ) 方 法 把 数据 添加 
到 put 实例 中 。 如 果 再 添加 一 个 时 间 戳 就 能 形成 一 
个 单元 格 。 

@ 批 量 put 操作 

批量 插入 put 实例 的 调用 形式 如 下 : 

Void put(List < Put > puts )throws IOException 

批量 操作 put ,用 户 需要 创建 一 个 列表 List 来 存 
放 所 有 的 Put 实例 ,将 想 要 存放 的 Put 实例 依次 放 
到 列表 List 上 来 ,最 后 再 执行 puts 操作 ,把 列表 List 


中 的 put 实例 都 更 新 存放 到 HBase 上 。 

2 ) get 方法 

从 客户 端 API 获取 已 存储 数据 ,使 用 Cet 对 象 ， 
通过 HTable. get (Cet ) 来 调用 。HTable 提供 了 get 
() 方 法 ,同时 还 有 与 之 对 应 的 Cet 类 。get 方法 分 为 
两 类 :一 类 是 一 次 获取 一 行 数据 , 另 一 类 是 一 次 获 
取 多 行 数据 。 

QD 单行 get 操作 

与 put 操作 一 样 , 在 检索 数据 时 ,要 按照 一 个 指 
定 的 行 键 (rowkey) 来 创建 用 来 get 的 实例 。 其 调用 
形式 如 下 : 

Result get( Get get) throws IOException 

@) 批 量 get 操作 

与 put 操作 一 样 get 操作 也 可 以 进行 批量 的 操 
作 。 其 操作 流程 和 思路 与 put 操作 一 样 , 不 再 费 述 。 
其 调用 形式 如 下 : 

Result[ | get( List < Cet > gets ) throwsIOFxception 

3 ) delete 方法 

人 单行 delete 

与 前 面 的 get( ) 方 法 和 put( ) 方 法 一 样 ,用 户 必 
须 先 创建 一 个 Delete 实例 ,然后 添加 想 要 删除 的 数 
据 的 详细 信息 。 其 调用 形式 如 下 : 

Void delete( Delete delete ) throws IOException 

@) 批 量 delete 

基于 列表 List 的 delete( ) 调用 与 基于 列表 的 
put( ) 调用 一 样 需要 先 创建 一 个 包含 Delete 实例 的 
列表 ,对 其 进行 配置 ,并 调用 如 下 方法 : 

Void delete( List < Delete > deletes ) throws IOFx- 


ception 


[2 
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3.1 基于 IFC 的 HBase 数据 库 设计 

数据 库 的 设计 是 API 层 设 计 和 应 用 层 设计 的 基 
础 ,只 有 将 数据 库 的 表格 设计 的 符合 逻辑 、 符 合 需 
求 ,才能 设计 合理 的 API 层 和 应 用 层 '" 。HBase 数 
据 库 接口 是 为 了 给 上 层 更 好 的 对 其 进行 数据 存 取 
而 根据 HBase 提供 的 API 写 的 类 包 , 其 主要 实现 了 
两 个 部 分 的 功能 ,一 是 对 数据 库 表 级 的 操作 ,二 是 
对 数据 库 中 数据 存 取 的 操作 ”| 。 

IFC 中 的 实体 其 属性 可 以 分 为 直接 属性 、 导 出 
属性 和 反 转 属性 。 在 IFC 标准 中 直接 属性 以 字符 串 
形式 来 直接 描述 实体 的 相应 属性 。IFC 中 的 导出 属 


性 对 应 的 是 一 个 IFC 实体 ,将 该 实体 实例 的 二 进 制 
序列 化 值 存储 在 HBaseTable 中 。IFC 中 反 转 属性 可 
以 通过 关联 相应 的 IHfcRelationship 表 得 到 其 属性 。 
如 表 4 所 示 。 在 IfcProject 表 中 ,IfeProject( 项 目 ) 实 
体 直接 属性 由 Name Description .Object Type Phase、 
LongName 这 些 属性 在 表 中 以 字符 串 的 形式 直接 描 
述 对 应 的 属性 值 。 导 出 属性 如 OwnerHistory 由 下- 
cOwerHistory 实体 对 象 的 二 进 制 序列 化 值 来 得 到 其 
属性 值 。 反 转 属 性 如 HasAssigenments 通过 关系 实 
IfcRel Assigns 来 描述 该 属性 。 要 获得 HasAssige- 
nments 属性 需要 先 获取 lfcRelAssigns 及 其 子 类 的 关 
系 对 象 ,再 通过 关系 对 象 指 向 一 个 具体 的 相关 实例 
对 象 。 又 如 HasAssociations 通过 关联 实体 IfcRelAs- 
soeiates 可 以 关联 构件 的 材料 信息 。 
LO 对 于 IFC 中 的 可 独立 交换 的 实体 建立 相应 的 

Base 表格 , 表 中 以 直接 属性 .导出 属性 和 反 转 属性 
作为 列 族 。 对 于 资源 层 中 的 资源 实体 不 用 建立 相 
成 的 表格 ,其 作为 可 独立 交换 实体 的 属性 存在 。 在 
HBBake 数据 库 中 将 IFC 可 独立 交换 的 实体 中 的 所 有 
廊 体 实体 建立 一 张大 表 。 对 于 辅助 实体 即 关系 实 
体 和 类 型 实体 是 主体 实体 的 属性 的 那些 类 型 可 以 
在 二 体 实体 表 中 仅 保存 其 Globalld。 
3.2” HBase JAVA API 的 设计 

-一 为 了 使 用 户 能 直接 对 IFC 数据 进行 编程 扩展 ， 
需 对 IFC 数据 进行 封装 ,进而 提供 统一 的 API( Ap- 
pition Programming Interface, 应 用 程序 编程 接 
95 API 设计 的 合理 性 是 数据 库 扩展 的 关键 0"。 
本 领 设计 的 基于 IFC 的 HBase JAVA API 的 对 象 模 
型 主要 包含 三 个 基本 类 :项 目 类 主体 实体 类 ,关系 
实体 类 。 如 图 4 所 示 。 

每 一 个 IFC 文件 有 且 仅 有 一 个 项 目 类 (下 
cProject) ,该 类 位 于 信息 交换 的 顶端 。 项目 类 (Pro- 
ject) 主要 存储 项 目的 基本 信息 。 包 括 项 目的 名 称 、 
项 目的 编号 \ 项 目 所 处 的 阶段 。 项 目 类 所 有 的 属性 

言 息 如 表 4 所 示 。 

API 中 的 主体 实体 类 主要 指 工程 中 继承 自 下 
cProduct 的 物理 对 象 。 该 对 象 实体 是 所 有 数据 存储 
的 依据 ,也 是 工程 中 的 主要 内 容 。 在 IFC 标准 中 建 
筑 产 品 通 过 运用 实体 IfcProduct 来 定义 ,IfcProduct 
表示 一 个 对 象 描述 的 几何 表示 和 局 部 位 置 '"1。 该 
类 中 包含 了 项 目的 场地 类 、 建 筑 类 楼 层 类 、 相 关 的 
建筑 构件 类 如 墙 柱 、 梁 、 板 、 楼 梯 、 屋 顶 等 。 
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表 4 IfcProject 表 


IfcProject( 项目 ) 


RowKey IfeProject 的 Globalld 值 
TimeStamp 时 间 惟 
列 族 列 说 明 
直接 属性 Name 名 称 (字符 串 ) 
(Direct) ”Deseription 描述 (字符 串 ) 
ObjectType 对象 类 型 (字符 串 ) 
Phase 工程 所 处 阶段 (字符 串 ) 
LongName 长 名 (字符 串 ) 
导出 属性 ”OwnerHistory “IfeOwerHistory” 对 象 实例 的 二 进 制 
(Derive) 序列 化 值 


Representation “IfcRepresentationContexts” 对 象 实例 
Contexts 的 二 进 制 序列 化 值 
“IfeUnitsAssigenment” 对 象 实例 的 二 
进 制 序 列 化 值 
反 转 属性 HasAssigenments 通过 一 个 分 配 关系 IcecRelAssigns 分 配 
其 他 HcObject 子 类 型 给 这 个 对 象 
IsDecomposedBy 通过 关系 实体 区 RelDecomposes 来 允 
许 这 个 对 象 是 由 其 他 对 象 合成 
通过 关系 实体 IfcRelDecomposes 来 允 
许 这 个 对 象 是 分 解 的 一 部 分 
HasAssociations ”通过 关系 实体 IfcRelAssociates 定义 在 
IFC 资源 层 概 念 的 关系 集 。 例 如 分 
类 、 库 或 文档 引用 
通过 关系 实体 IfcRelDefines 进一步 定 
义 对 象 的 类 型 或 属性 信息 的 关系 集 
(静态 或 动态 的 定义 ) 


HBaseJAVA API 


UnitsInContext 


( Inverse) 


Deconposes 


IsDefinedBy 


Wn 


项 目 类 主体 实体 类 关系 实体 类 
(Project) (Product) (Relationship) 


(Site) 
(Building) 


建筑 楼 层 类 
(BuildingStorey) 


建筑 元 素 类 
《Elemnet ) 
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在 主体 实体 中 通过 关系 实体 类 可 以 实现 实体 
与 实体 .实体 与 属性 之 间 的 定义 ,对 象 化 的 关系 类 
将 实体 引用 保存 在 自身 实例 中 ,这 些 引 用 关系 在 实 
体 中 表现 为 反 转 属性 。 因 此 关系 类 是 连接 项 目 中 
实体 与 实体 .实体 与 属性 之 间 的 关系 的 。 该 类 的 存 
在 依附 于 项 目 类 和 主体 实体 类 。 
3.3 利用 HBase JAVA API 实现 存储 的 示例 

(1) 连 接 HBase 数据 库 

在 Java 代码 中 ,为 了 连接 到 HBase ,我 们 首先 创 
建 一 个 配置 ( Configuration ) 对 象 ,使 用 该 对 象 创建 一 
个 HTable 实例 。 这 些 配置 文件 信息 包括 Zookeeper 
地 址 .主机 地 址 等 。 这 个 HTable 对 用 于 处 理 所 有 的 
客户 端 API 调用 。 通 过 语句 “Configuration conf = 
HBaseConfiguration. create( ) ”来 获取 HBase 数据 库 
下 的 配置 信息 息 , 默认 的 构造 方式 会 从 hbase-de- 
fanld xml 和 hbase-site. xml 中 读 取 配置 ,如 果 class- 
8 中 没有 这 两 个 文件 , 需 自己 配置 。 通 过 “con- 
ne = = ConnectionFactory. createConnection ( conf ) ” 


Public class HBaseUtil { 


BD 


[ep 


private static Configuration conf; 
ee, private static Connection connection; 
机 pf 
> static { 
conf= HBaseConfiguration.create(); // 获得 配制 文件 对 象 


”conf.set("hbase.zookeeper.quorum","192.168.52.140");// 设 置 配 置 参数 


Ss connection = ConnectionFactory.createConnection(conf);// 
交接 对 银 
© admin=connection.getAdmin(); 
} catch (IOException e) { 
e.printStackTrace(); 
} 
} 
图 5 创建 连接 代码 
(2) 创 建 表 


需要 用 HTableDescriptor 构建 一 张 表 ,并 且 使 用 
HColumnDescriptor 添加 一 个 或 多 个 列 篮 ,然后 调用 
createTable 方法 建 表 。 完 成 之 后 再 在 表 中 添加 一 些 
数据 。 如 图 6 所 示 。 

(3 ) 添 加 数据 

对 于 解析 后 的 IFC 文件 通过 前 面 所 述 getCol- 
lections 方法 及 get-method 方法 等 可 以 获取 到 所 有 
实体 集合 及 其 属性 集合 。 用 Hbase 中 API 代码 循环 
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读 取 这 些 集合 ,将 读 取 的 到 集合 对 应 放 和 人 HBase 表 
中 。 添 加 数据 时 创建 put 对 象 ,利用 rowkey 添加 一 
行 数据 ,Put 的 构造 函数 都 需要 指定 行 键 。 添 加 具 
体 数据 调用 put add( ) 方 法 。 所 有 的 数据 都 被 添加 
之 后 ,我们 调用 HTable. put( ) 方 法 会 将 数据 保存 进 
HBase 的 table 中 。 也 就 是 说 创建 Put 对 象 及 
put. add 过 程 都 是 在 构建 一 行 的 数据 ,创建 Put 对 象 
时 相当 于 创建 了 行 对 象 ,add 的 过 程 就 是 往 目 标 行 
里 添加 cell, 直到 table. put 才 将 数据 插入 表格 。 部 
分 代码 如 图 7 所 示 。 


/ 新建 一 个 表 的 描述 

HTableDescriptortableDesc=newHTableDescriptor(IfcProject); 
W 在 描述 里 添加 列 族 

for (String columnFamily : columnFamilys) { 
tableDesc.addFamily(newHColumnDescriptor("Direct")); 
tableDesc.addFamily(newHColumnDescriptor("Derive ")); 
tableDesc.addFamily(newHColumnDescriptor("Inverse ")); 

} 

4 根据 配置 好 的 描述 建 表 
hAdmin.createTable(tableDesc); 
System.out.println(" 创 建 表 "+ IfcProject +" 成 功 !"); 


6 创建 表 的 部 分 代码 


Put put=null; 

1/ 循环 读 取 

for (String str : set) { 

/指定 添加 行 ,设置 RowKey, 该 行 键 为 IfeProject 的 22 为 GUID 值 

Put put = new Put(Bytes.toBytes("0cs8HZC9$1BhfpOzkrKVrbn ")); 

// 往 列 族 Driect 中 添加 数据 

put.add(Bytes.toBytes(Driect), Bytes.toBytes(Name), Bytes.toBytes(value)); 
put.add(Bytes.toBytes(Driect), Bytes.toBytes(Description), Bytes.toBytes(value)); 

// 往 列 族 Derive 中 添加 数据 

put.add(Bytes.toBytes(Derive), Bytes.toBytes(OwerHistory), Bytes.toBytes(value)); 
put.add(Bytes.toBytes(Derive), Bytes.toBytes(UnitsInContext), Bytes.toBytes(value)); 
// 往 列 族 Inverse 中 添加 数据 

put.add(Bytes.toBytes(Inverse), Bytes.toBytes(HasAssigenments), Bytes.toBytes(value)); 


table.put(put); 
table.flushCommits(); 
table.close(); 


7 添加 数据 部 分 代码 


4 结论 与 展望 


本 文 在 大 数据 背景 下 研究 将 基于 IFC 标准 的 建 


筑 信息 模型 (BIM) 存储 到 HBase 数据 库 中 ,并 且 能 
实现 对 建筑 数据 的 添加 删除 以 及 存储 与 查询 功能 。 


基于 HBses 数据 库 的 数据 存储 技术 与 传统 的 基于 文 
件 .基于 关系 数据 库 和 基于 面向 对 象 的 数据 库 的 存 
储 相 比 , 有 着 很 大 的 优势 :1) Hbase 数据 库 能 存储 海 
量 的 数据 ;2) 分 布 式 的 存储 与 计算 模式 将 大 大 提高 
运行 计算 速度 ;3) 具有 良好 的 扩展 性 能 ,去 掉 了 关 
系数 据 库 的 关系 特性 ,数据 之 间 是 弱 关 系 性 ,非常 
容易 扩展 ;4) 数据 模型 灵活 ,无 须 事 先 为 要 存储 的 
数据 建立 字段 ,随时 可 以 存储 自 定义 的 数据 格式 。 

但 本 文 仅仅 是 实现 了 基于 IFC 标准 的 建筑 数据 
的 存储 技术 。 在 本 文 研 究 的 存储 技术 基础 之 上 还 
有 多 项 技术 有 待 进一步 发 展 : 

(1) 如 何 将 非 结 构 化 的 建筑 信息 如 工程 施工 合 


http://www. buildingsmart-tech. org. 

李 丽 娜 . 基于 BIM 的 建设 项 目 文本 信息 集成 管理 研究 
LD]. 大连 理工 大学, 2015. 
姜 韶 华 , 李 丽 娜 , 戴 利 人 . 基于 BIM 的 项 目 文本 信息 集 
成 方法 研究 1]. 工程 管理 学 报 . 2015,，29 (4): 
101-106. 

董 戏 . BIM 技术 在 空间 结构 中 的 应 用 与 开发 [D]. 上 海 
交通 大 学 , 2015. 

刘 照 球 , 李 云 贵 , 昌 西林 ,等 . 建筑 结构 信息 集成 的 程 
序 实现 [中 .沈阳 建筑 大 学 学 报 ( 自然 科学 版 ). 2009， 
25(3 ) : 467-473. 

Ma L. ,Sacks R. A cloud based BIM platform for informa- 


tion collaboration[ C ]. International Symposium on Auto- 


mation and Robotics in Construction, 2016. 

[ 7] 张弛. hbase 数据 库 访问 接口 的 设计 与 实现 LD]. 北京 
大 学 , 2013. 

[ 8 ] 陈 潇 窒 . 5D 模型 在 建筑 管理 软件 中 的 设计 与 实现 
LD]. 上海 交通 大 学 , 2013. 

]」 孙 志 佳 . 基于 Hadoop 的 在 线 购物 原型 系统 的 设计 与 
实现 [DJ]. 东北 大 学 , 2010. 
林 良 帆 . BIM 数据 存储 与 集成 管理 研究 [ 
大 学 , 2013. 


同 . 工 程 现场 照片 工程 变更 等 文件 挂 接 到 IFC 模型 
中 5 进而 存储 在 Hbase 数据 库 ; 

LO 〇 (2) 在 Hbase 数据 库 上 再 研究 开发 图 形 显示 界 
面 已 编 辑 平台 ,使 建筑 各 个 参与 方 可 以 在 该 数据 库 
基础 上 进行 前 端的 编辑 操作 ,进一步 完成 建筑 信息 19 
故 姑 数据 平台 的 共享 与 交互 ，; | 

QON(3) 在 基于 HBase 存储 的 基础 上 进一步 研究 基 [10] 
逢 MapReduce 的 建筑 行业 大 数据 的 分 析 功 能 ,将 建 


D]. 上海 交 通 


策 下 与 大 数据 技术 真正 结合 起 来 。 [11] Ma Z.,WeiZ.,Song W. Application and extension of the 
《一 IFC standard in construction cost estimating for tendering 
参考 文献 in China[ J ]. Automation in Construction. 2011, 20(2): 


[EE Liebich T. ,Wix J. IFC Technical Guide[ EB/OL]2000. p00 


= Research on HBase-based BIM Model Storage Technology 


Chen Yuan, Yue Shihua 


(School of Civil Engineering, Zhengzhou University, Zhengzhou 450001, China) 


Abstract: With the rapid development of computer and Internet technology, building information model 
(BIM) has emerged. As a new concept of building technology, BIM has been the driving force of great changes in 
the construction industry. At the same time, big data and cloud computing technologies have become hot topics. It 
will be the development trend in future construction industry to combine big data and cloud computing with BIM 
technology. This paper presents a research about how to store a BIM model in open source HBase database based on 
big data platform: designing a IFC-based HBase database through the research and parsing of the internal structure 
of the open standard IFC of BIM model, and then developing IFC-based general library of HBase JAVA API. Final- 
ly, the storage method is explained through using the storage example of HBase JAVA API. 

Key Words: BIM; IFC; JAVA API; Data Storage 


